单因子实验设计
在每个实验组下都进行独立的观测,并比较不同测量值均值之间的差异是否显著。
F检验
模型假设
令Yij表示第i个实验组的第j个观测,首先确定统计模型为:
Yij=μ+αi+ϵij
这里的μ是总的均值水平,αi是第i个实验组的不同效应,ϵij是第i个实验组中的第j个观测值的随机误差。
假设误差是独立的,服从正态分布,且ϵij∼N(0,σ2)。
对α进行规范化:∑Iαi=0
我们的原假设是,各组之间的观测没有区别,αi=0
基本性质
- Yijˉ
- E(Yijˉ)=μ+αi
- Var(Yijˉ)=σ2
- Yiˉ=J1∑JYij
- E(Yiˉ)=μ+αi
- Var(Yiˉ)=Jσ2
- Yˉ=IJ1∑I∑JYij
- E(Yˉ)=μ
- Var(Yˉ)=IJ1σ2
方差分析基于以下的等式:
∑I∑J(Yij−Yˉ)=∑I∑J(Yij−Yiˉ)2+J∑I(Yiˉ−Yˉ)2
即SSTOT=SSW+SSB,分别表示组内误差平方和、组间误差平方和。
- E(SSW)=I(J−1)σ2
- SSW=∑I(J−1)si2
- sp2=I(J−1)SSW
- E(SSB)=J∑Iαi2+(I−1)σ2
可以发现,若αi=0,则SSW/I(J−1)和SSB/(I−1)的值应该是相近的。因此,我们需要找到比较两个平方和的方法,特别是在原假设成立下的统计量。
统计量
在误差的方差相同的情况下
对于SSW,每一个组的样本方差都服从σ2(J−1)Si2∼χ2(J−1),那么σ2SSW∼χ2(I(J−1))
对于SSB,σ2/J∑I(Yiˉ−Y)2=σ2SSB∼χ2(I−1)
因此,可以定义F统计量:
F=SSW/[I(J−1)]SSB/(I−1)
因此,若原假设成立,F统计量应该接近于1。
多重比较问题
我们使用F统计量可以检验不同的测量均值是否不全相同,但没有比较任意两个测量均值之间是否有差异。
图基方法
可以用来构建所有均值对差异的置信区间
若样本容量是全部相等的,误差服从常数方差的正态分布,则Yiˉ−μi∼N(0,σ2/J),可以利用sp2/J估计这个方差。
构造一个Studentized range distribution:
i1,i2maxsp/J∣(Yi1ˉ−μi1)−(Yi2ˉ−μi2)∣
可以用来求得置信区间